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Beschreibung 

Protein© warden in der Zelle an den Ribosomen synthetisiert, die im Cytoplasma lokalisiert sind. 
Proteine, die aus dem Cytoplasma heraus transported werden, tragen am Aminoterminus eine relativ kurze 
5 Peptidkette, die beim Passieren durch die Cytoplasmanembran enzymatisch abgetrennt wird, wobei das 
"reife" Protein entsteht. Diese kurze Peptidsequenz wird als "Signalpeptid" Oder auch als Prae- bzw. 
leader-Sequenz bezeichnet. 

Es wurde schon flir eine Vielzahi sekretorischer Proteine die am Aminoterminus angeordnete Signalse- 
quenz charakterisiert. Sie besteht generell aus einer hydrophoben Region von etwa 10 bis 20 Aminosauren, 
10 die als "core" bezeichnet wird, an deren Aminoterminus eine kurze Peptidsequenz ("pre-core") gebunden 
ist, die meist eine positiv geladene Aminosaure (oder mehrere) aufweist. Zwischen dem Carboxyterminus 
der hydrophoben Region und dem Aminoterminus des "reifen" transportierten Proteins liegt eine kurze 
Peptidsequenz ("post-core"), welche die Spaltstelle ("splice-site") enthalt und fur eine gunstige raumliche 
Anordnung sorgt. 

15 Aus der US-Patentschrift 4 411 994 ist bekannt, das Gen fur ein zu exprimierendes Protein an ein 
bakterielles Gen zu koppeln, das fur ein extracellulares oder periplasmatisches TrSgerprotein codiert, um so 
den Transport des gewUnschten Proteins aus dem Cytoplasma zu bewerkstelligen. Fur dieses Verfahren 
muB man ein wirtseigenes, bakterielles Gen fur ein periplasmatisches, "outer membrane"- oder ein 
extracellulares Protein isolieren. Dieses Gen wird dann mit einem Restriktionsenzym geschnitten, das Gen 

20 fur das zu transportierende Protein in die gebildete Schnittstelle inseriert und die Wirtszelle mit einem 
Vektor transformiert, der das so gebildete Fusionsgen enthSlt. Die Isolierung des natUrlichen Gens und 
seine Charakterisierung zur Auswahl geeigneter Schnittstellen ist auBerordentlich aufwendig. 

Erfindungsgemafi wird dieser Aufwand dadurch vermieden, daB von einer synthetischen Signalsequenz 
Gebrauch gemacht wird. 

25 Die Erfindung betrifft deshalb eine synthetische Signalsequenz zum Transport von Proteinen in 
Expressionssystemen, die dadurch gekennzeichnet ist, daB die DNA im wesentlichen einer natUrlichen 
Signalsequenz entspricht, aber eine oder mehrere Schnittstellen fur Endonucleasen aufweist, die in der 
natUrlichen DNA nicht enthalten sind. Weitere Aspekte der Erfindung und bevorzugte Ausgestaltungen sind 
im folgenden wiedergegeben bzw. in den PatentansprUchen niedergelegt. 

30 Die DNA soli "im wesentlichen" der einer natUrlichen Signalsequenz entsprechen. Hierunter ist zu 
verstehen, daB das exprimierte Signalpeptid mit dem natUrlichen weitgehend oder vollig ubereinstimmt, im 
letzteren Falle also lediglich auf der DNA-Ebene insofern ein Unterschied besteht, als die synthetische DNA 
mindestens eine Schnittstelle aufweist, die in der natUrlichen DNA-Sequenz nicht enthalten ist. Dieser 
Einbau der erfindungsgemaBen Schnittstelle bedingt also eine mehr oder weniger groBe Abweichung von 

35 der natUrlichen Sequenz, wobei unter Umstanden auf Codons zurUckgegriffen werden muB, die bekannter- 
maBen vom jeweiligen Wirtsorganismus weniger bevorzugt werden. Uberraschenderweise ist hiermit jedoch 
kein Nachteil in der Expression verknupft. Das gezielte "MaBschneidern" des synthetischen Gens bringt 
vielmehr so viele Vorteile mit sich, daB ein eventueller Nachteil durch den "unnatUrlichen" Codon-Gebrauch 
im allgemeinen weit Uberkompensiert wird. Es hat sich sogar gezeigt, daB der Ersatz des Startcodons GTG, 

w das im Gen der Alkalischen Phosphatase von E. coli vorkommt, durch ATG zu einer stark erhohten 
Expression fUhrt. Ein besonderer Vorteil der Erfindung liegt darin, daB die Wirtszelle weniger Ballast-Protein 
produzieren muB, da das zu exprimierende Gen direkt an das 3'-Ende der synthetischen DNA-Signalse- 
quenz angeknUpft werden kann. Daruber hinaus ergeben sich insofern Vorteile, als sich bei der Konstruktion 
der synthetischen DNA an den Enden Uberstehende DNA-Sequenzen fUr bestimmte Restriktionserken- 

45 nungsstellen vorsehen lassen, die eine Klonierung dieser Sequenz erlauben und im Falle unterschiedlicher 
Erkennungsstellen einen definierten Einbau in einen Klonierungsvektor gestatten. Hierdurch wird nach dem 
"Baukastenprinzip" ein Einbau in beliebige Vektoren ermoglicht. 

Interne Erkennungsstellen fUr Restriktionsenzyme gestatten die Ankoppelung beliebiger homologer oder 
heterologer Gene im richtigen Leserahmen. Uber diese internen Schnittstellen konnen auch auf einfache 

50 Weise Variationen in die DNA der Signalsequenzen eingefuhrt werden, die zu in der Natur nicht vorkom- 
menden Praesequenzen fUhren. 

ZweckmaBig werden diese internen Schnittstellen in die Bereiche vor und nach der hydrophoben 
Region gelegt, insbesondere in die "post-core"-Region, wobei die Spaltstelle und/oder deren Umgebung 
modifiziert werden kann. Es ist naturlich auch moglich, die "core"-Region in an sich bekannter Weise zu 

55 modifizieren. 

Unter Berucksichtigung bekannter Regeln (G. von Heijne, J. Mol. Biol. 173 (1984) 243 - 251) kann Uber 
geeignete Schnittstellen im Genabschnitt, der fUr den carboxyterminalen Teil des Praepeptids codiert, die 
Signalpeptidase-Spaltstelle derart geplant werden, daB kein Fusionsprotein, sondern direkt das gewunschte, 

2 
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i.a. eukaryotische Peptid in nativer Form exprimiert wird. Gene natiirlichen Ursprungs lassen eine solche 
Prozessierung im allgemeinen nicht zu. 

Als Signalsequenzen kommen im Prinzip alle literaturbekannten Signalsequenzen (M.E.E. Watson; 
Nucleic Acids Res. 12 (1984), 5145 - 5164), Variationen derselben sowie daraus abgeleitete "idealisierte" 
5 Signalsequenzen (D. Perlman und H.O. Halvorson; J. Mol. Biol. 167 (1983), 391 - 409) in Betracht. 

Bevorzugte Wirtsorganismen sind E. coli, Streptomyces, Staphylococcus-Arten wie S. aureus, Bacillus- 
Arten wie B. subtilis, B. amyloliquifaciens, B. cereus oder B. licheniformis, Pseudomonas, Saccharomyces, 
Spodoptera frugiperda und Zellinien hoherer Organismen wie pflanzliche oder tierische Zellen. 

Prinzipiell lassen sich alle diejenigen Proteine prokaryotischen oder eukaryotischen Urspungs durch 
to Transportexpression gewinnen, die membrangangig sind. Bevorzugt sind aber pharmazeutisch bedeutende 
Peptidprodukte wie Hormone, Lymphokine, Interferone, Blutgerinnungsfaktoren und Vakzine, die in der 
Natur auch als Peptide mit einer aminoterminalen Praesequenz codiert sind. Diese eukaryotische Praese- 
quenz wird jedoch in der Regel in den prokaryotischen Wirtsorganismen nicht von den wirtseigenen 
Signalpeptidasen abgespalten. 
rs In E. coli sind die Gene fur die periplasmatischen und "outer membrane"-Proteine zur Transportexpres- 
sion geeignet, wobei die erstgenannten das Produkt ins Periplasma, die letztgenannten aber eher an die 
auflere Membran dirigieren. 

Als Beispiel wird die DNA-Signalsequenz des periplasmatischen Proteins Alkalische Phosphatase, das 
in E. coli hochexprimierbar ist, angefuhrt, ohne daS die Erfindung darauf beschrankt ware. 
20 Im folgenden ist die Prae-Sequenz einschlieSlich der ersten zwanzig Aminosauren der Alkalischen 
Phosphatase von E. coli dargestellt: 



1 5 10 

Met-Lys-Qln-Ser-Thr-Ile-Ala-Leu-Ala-Leu-Leu-Pro-Leu-Leu- 

PhE-Thr-Pro-Val-Thr-Lys-Ala-Arg-Thr-Pro-Qlu-Met-Pro-Val. 

Leu-aiS-Asn-Arg-Ala-Ala-Oln-Oly-ABn-Ile-Thr-Ali-Pro 



t- bevorzugte Spaltstelle der Signalpeptldase 



35 Es hat sich gezeigt, dal3 bis zu etwa 40, meist etwa 20 zusatzliche Aminosauren des reifen Proteins fur eine 
korrekte Prozessierung ausreichend sind. In vielen Fallen genugen jedoch auch weniger zusatzliche 
Aminosauren, beispielsweise etwa 10, vorteilhaft etwa 5. Da eine kurzere Proteinkette eine geringere 
Beanspruchung des Protein-Biosyntheseapparats der Wirtszelle bedingt, ist eine vorteilhafte Ausfuhrungs- 
form der Erfindung in der DNA-Sequenz I (Anhang) niedergelegt, die fUr die Praesequenz der Alkalischen 

40 Phosphatase sowie zusatzlicher 5 Aminosauren des reifen Proteins codiert. Die DNA-Sequenz I entspricht 
bis auf einige Triplett-Variationen - namlich solchen, die singulare Restriktionsenzym-Schnittstellen einfuh- 
ren und das Startcodon GTG durch ATG ersetzen - der natiirlichen Sequenz der Alkalischen Phosphatase. 
An den Enden des codierenden Stranges befinden sich "UberhSngende" DNA-Sequenzen entsprechend der 
Restriktionsendonuclease EcoR I, die den Einbau in gangige Klonierungsvektoren, beispielsweise die 

45 handelsublichen Plasmide wie pBR 322, pUC 8 oder pUC 12 erlauben. Zusatzlich wurden innerhalb des 
Gens der DNA-Sequenz I eine Reihe von weiteren singularen Schnittstellen fur Restriktionsenzyme 
eingebaut, die einerseits die Ankoppelung heterologer Gene an der richtigen Stelle und im gewunschten 
Leserahmen ermoglichen und andererseits auch die DurchfUhrung von Variationen erlauben: 

50 



55 
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Restriktionsenzym 



Schnitt nach Nucleotld-Nr. 
(Im codlerenden Strang) 



5 



Sau 3 A 



19 



Pvu I 



22 



TO 



Hpa II 
Nci I 



Alu I 



Hph I 
Ava II 



54 
54 
66 
68 
70 



) (im nattlrlichen 
) Gen vorhanden) 



15 



Es ist selbstverstandlich auch moglich, die uberhangenden Sequenzen so zu konstruieren, daS sie 
verschiedenen Restriktionsenzymen entsprechen, was dann den Einbau in geeignete Vektoren in definierter 
Orientierung erlaubt. Der Fachmann wird hierbei abwagen, ob der mit dem Konstruieren des Gens und 

20 seinem gezielten Einbau verbundene Aufwand schwerer wiegt als die zusStzliche Selektionsarbeit, die mit 
einem Einbau in beiden Orientierungsrichtungen bei identischen Uberstehenden Enden verbunden ist. 

Die DNA-Sequenz I lafit sich aus 6 Oligonucleotiden mit einer Lange von 26 - 31 Basen aufbauen, 
indem diese zunachst chemisch synthetisiert und dann uber "sticky ends" von 6 Nucleotiden enzymatisch 
verknupft werden. Der Einbau des synthetischen Gens in Klonierungsvektoren, beispielsweise in die 

25 genannten handelstiblichen Plasmide, erfolgt in an sich bekannter Weise. 

Als Beispiel fUr die Expression eines eukaryotischen Gens in E. coli mit Hilfe einer erfindungsgemafien 
Praesequenz wird im folgenden die Synthese von Affen-Proinsulin beschrieben: Man konstruiert eine DNA- 
Sequenz, bei der hinter einer chemisch-synthetischen Regulationsregion, bestehend aus einem bakteriellen 
Promotor, einem lac-Operator und einer ribosomalen Bindungsstelle (Deutsche Patentanmeldung P 34 30 

30 683.8), 6 - 14 Nucleotide von der Ribosomen-Bindungsstelle entfernt, an eine anschlieBende Erkennungsse- 
quenz fur EcoR I die DNA-Sequenz I und daran anschliefiend das Proinsulingen (W. Wetekam et al., Gene 
19 (1982)179-183) angeordnet ist. Das exprimierte Proinsulin-Fusionspeptid enthalt an Aminoterminus noch 
9 zusatzliche Aminosauren, die enzymatisch oder chemisch abgespalten werden konnen. 

Der Einbau des synthetischen Gens in pUC 8 sowie die Konstruktion von Expressionsplasmiden, die 

35 eukaryotische Gene an die DNA-Sequenz I gekoppelt enthalten, erfolgt in an sich bekanner Weise. Hierzu 
kann auf das Lehrbuch von Maniatis (Molecular Cloning, Maniatis et al., Cold Spring Harbor, 1982) 
verwiesen werden. Die Transformation der so erhaltenen Hybridplasmide in geeignete Wirtsorganismen, 
vorteilhaft E. coli, ist ebenfalls an sich bekannt und in dem vorstehend genannten Lehrbuch eingehend 
beschrieben. Die Gewinnung der exprimierten Proteine und deren Reinigung ist ebenfalls beschrieben. 

40 In den folgenden Beispielen werden noch einige Ausgestaltungen der Edindung im einzelnen erlautert, 
woraus sich die Vielzahl der moglichen Abwandlungen (und Kombinationen) fur den Fachmann ergeben. 
Prozentangaben beziehen sich hierbei auf das Gewicht, wenn nichts anderes angegeben ist. 



1 . Chemische Synthese eines einzelstrangigen Oligonucleotids 

Am Beispiel des Genbausteins la, der die Nucleotide 1 - 29 des codierenden Strangs umfafit, wird die 
Synthese der Genbausteine erlautert. Nach bekannten Methoden (M.J. Gait et al., Nucleic Acids Res. 8 

50 (1980) 1081 - 1096)) wird das am 3'-Ende stehende Nucleosid, im vorliegenden Falle also Guanosin 
(Nucleotid Nr. 29), an Kieselgel (FRACTOSIL, Firma Merck) uber die 3'-Hydroxyfunktion covalent gebunden. 
Hierzu wird zunSchst das Kieselgel unter Abspaltung von Ethanol mit 3-(Triethoxysilyl)-propylamin umge- 
setzt, wobei eine Si-O-Si-Bindung entsteht. Das Guanosin wird als N 2 -lsobutyryl-3'-0-succinoyl-5'-dimetho- 
xytritylether in Gegenwart von Paranitrophenol und N,N'-Dicyclohexylcarbodiimid mit dem modifizierten 

55 Trager umgesetzt, wobei die freie Carboxygruppe der Succinoylgruppe den Aminorest der Propylamingrup- 
pe acyliert. 

In den folgenden Syntheseschritten wird die Basenkomponente als 5'-0-Dimethoxytrityl-nucleosid-3'- 
phosphorigsaure-monomethylester-dialkylamid oder -chlorid eingesetzt, wobei das Adenin als N 6 -Benzoyl- 



Beispiele 
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Verbindung, das Cytosin als N* -Benzoyl- Verbindung, das Guanin als N 2 -lsobutyryl-Verbindung und das 
keine Aminogruppe enthaltende Thymin ohne Schutzgruppe vorliegen. 

50 mg des polymeren Tragers, der 2 umol Guanosin gebunden enthalt, werden nacheinander mit den 
folgenden Agentien behandelt: 
5 a) Nitromethan 

b) gesattigte Zinkbromidlosung in Nitromethan mit 1 % Wasser 

c) Methanol 

d) Tetrahydrofuran 

e) Acetonitril 

jo f) 40 umol des entsprechenden Nucleosidphosphits und 200 umol Tetrazol in 0,5 ml wasserfreiem 
Acetonitril (5 Minuten) 

g) 20 % Acetanhydrid in Tetrahydrofuran mit 40 % Lutidin und 10 % Dimethylaminopyridin (2 Minuten) 

h) Tetrahydrofuran 

i) Tetrahydrofuran mit 20 % Wasser und 40 % Lutidin 

75 j) 3 % Jod in Kollidin/Wasser/Tetrahydrofuran im Volumenverhaltnis 5:4:1 
k) Tetrahydrofuran und 
I) Methanol. 

Unter "Phosphit" wird hierbei der Desoxyribose-3'-monophosphorigsaure-monomethylester verstanden, 
wobei die dritte Valenz durch Chlor Oder eine tertiare Aminogruppe, beispielsweise einen Morpholinorest, 
20 abgesattigt ist. Die Ausbeuten der einzelnen Syntheseschritte konnen jeweils nach der Detritylierungsreak- 
tion (b) spektrophotometrisch durch Messung der Absorption des Dimethoxytritylkations bei der Wellenlan- 
ge von 496 nm bestimmt werden. 

Nach abgeschlossener Synthese des Oligonucleotids werden die Methylphosphatschutzgruppen des 
Oligomers mit Hilfe von p-Thiokresol und Triethylamin abgespalten. Anschliefiend wird durch 3-stundige 
25 Behandlung mit Ammoniak das Oligonucleotid vom festen Trager abgetrennt. Eine 2- bis 3-tagige Behand- 
lung der Oligomeren mit konzentriertem Ammoniak spaltet die Aminoschutzgruppen der Basen quantitativ 
ab. Das so erhaltene Rohprodukt wird durch Hochdruckfliissigkeitschromatographie (HPLC) Oder durch 
Polyacrylamid-Gelelektrophorese gereinigt. 

Ganz entsprechend werden auch die Obrigen Genbausteine lb - If synthetisiert, deren Nucleotidfolge 
30 aus der DNA-Sequenz II (Anhang) hervorgeht. 

2. Enzymatische VerknUpfung der einzelstrangigen Oligonucleotide zur DNA-Sequenz I 

Die endstSndigen Oligonucleotide la und If werden nicht phosphoryliert. Damit wird eine Oligomerisation 
35 liber die Uberhangenden Enden vermieden. Zur Phosphorylierung der Oligonucleotide lb, Ic, Id und le 
werden jeweils 1 nmol dieser Verbindungen mit 5 nmol Adenosintriphosphat und vier Einheiten T4- 
Polynucleotid-Kinase in 20 lil 50 mM Tris-HCI-Puffer (pH 7,6), 10 mM Magnesiumchlorid und 10 mM 
Dithiothreitol (DTT) 30 Minuten bei 37 "0 behandelt. Das Enzym wird durch funfminutiges Erhitzen auf 
95 °C desaktiviert. AnschlieQend werden die Oligonucleotide la bis If vereinigt und zum Doppelstrang 
w hybridisiert, indem man sie in einer 20 mM KCI-L6sung erhitzt und dann langsam (im Laufe von 2 Stunden) 
auf 16"C abkuhlt. Die Ligation zum DNA-Fragment gemaS DNA-Sequenz I erfolgt durch Reaktion in 40 ul 
50 mM Tris-HCI-Puffer (20 mM Magnesiumchlorid und 10 mM DTT) mit Hilfe von 100 Einheiten T4-DNA- 
Ligase bei 15 °C im Laufe von 18 Stunden. 

Die Reinigung des Genfragments erfolgt durch Gelelektrophorese auf einem 10 %igen Polyacrylamidgel 
45 (ohne Harnstoffzusatz, 20 x 40 cm, 1 mm Dicke), wobei als Markersubstanz <f>X 174 DNA (Fa. BRL), 
geschnitten mit Hinf I, oder pBR 322, geschnitten mit Hae III, dient. 

3. Einbau des Genfragmentes in pUC 8 

50 Das handelsiibliche Plasmid pUC 8 wird in bekannter Weise mit der Restriktionsendonuclease EcoR I 
nach den Angaben des Herstellers geoffnet. Der Verdauungsansatz wird auf einem 5 %igen Polyacrylamid- 
gel durch Elektrophorese in bekannter Weise aufgetrennt und die DNA durch AnfSrben mit Ethidiumbromid 
oder durch radioaktive Markierung ("Nick-Translation" nach Maniatis, a.a.O.) sichtbar gemacht. Die Plasmid- 
bande wird anschlieSend aus dem Acrylamidgel ausgeschnitten und elektrophoretisch vom Polyacrylamid 

55 abgetrennt. 
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4. Einbau der DNA-Sequenz I in ein Expressionsplasmid 



Das Expressionsplasmid pWI 6 mit der Information fUr das Affen-Proinsulin wird wie folgt konstruiert: 
10 ug des Plasmids pBR 322 werden mit den Restriktionsendonucleasen Eco Rl/Pvu II verdaut und 

5 anschlieSend durch eine "fill-in"-Reaktion mit Klenow-Polymerase an der Eco Rl-Schnittstelle aufgefullt. 
Nach gelelektrophoretischer Auftrennung in einem 5 %igen Polyacrylamidgel la'St sich das Plasmidfragment 
von 2293 Bp Lange durch Elektroelution gewinnen (Figur 1). 

Aus dem Plasmid pBR 322 mit integrierter Affenpraproinsulin-DNA (Wetekam et al., Gene 19 (1982) 
179 - 183) wird diese durch Verdauung mit den Restriktionsendonucleasen Hind III und Mst I (als Fragment 

10 von etwa 1250 Bp) isoliert und in das Plasmid pUC 9 wie folgt rekloniert: Das Plasmid pUC 9 wird mit dem 
Enzym Bam HI gespalten, die Schnittstelle in einer Standard-"fill-in"-Reaktion mit Klenow-Polymerase 
("large fragment") aufgefullt, mit dem Restriktionsenzym Hind III nachgeschnitten und die DNA gelelektro- 
phoretisch in einem 5%igen Polyacrylamidgel von den ubrigen DNA-Fragmenten abgetrennt. In das 
geoffnete Plasmid wird das isolierte Insulin-DNA-Fragment von etwa 1250 Bp Lange integriert. 

rs Zur Abtrennung der "untranslated region" und der Praesequenz wird das so modifizierte pUC 9-Plasmid 
mit Hae III verdaut und das 143 Bp lange Fragment zur Abspaltung der letztenbeiden Nucleotide aus der 
Praesequenz unter limitierenden Enzymbedingungen mit Bal 31 verdaut. Man erhalt so am Amino-Terminus 
als erstes Codon TTT, das fur Phenylalanin als erste Aminosaure der B-Kette steht. 

An dieses Fragment wird nun ein fur Eco Rl spezifischer Adaptor in einer "blunt-end" Ligationsreaktion 

20 ligiert: 



a) 5' AAT TAT GAA TTC OCA ATQ 
Eco RI TA CTT AAQ COT TAC 

25 

b) 5' AAT TAT GAA TTC GCA AG A 
Eco RI TA CTT AAG CGT TCT 



so Urn eine Polymerisierung der Adaptoren zu vermeiden, wurden diese unphosphoryliert in die Ligationsreak- 
tion eingesetzt (was in den Figuren mit Eco RI" angedeutet ist, ebenso wie, z. B. durch AuffOllen, 
inaktivierte Erkennungssequenzen). Der Adaptor a) weist am Ende ein Codon filr Methionin auf, der Adaptor 
b) das Codon filr Arginin. 

Nach der Variante a) wird somit ein Genprodukt erhalten, bei dem durch Bromcyanspaltung eine 

35 Abtrennung des bakteriellen Anteils moglich ist, wahrend die Variante b) eine Trypsinspaltung erlaubt. 

Das Ligationsprodukt wird mit Mbo II verdaut. Nach gelelektrophoretischer Auftrennung erhalt man ein 
DNA-Fragment von 79 Bp Lange mit der Information fUr die Aminosauren Nr. 1 bis 21 der B-Kette. 

Das Gen fur die restliche Information des ProinsulinmolekOls (einschiieSlich einer G-C-Sequenz aus der 
Klonierung und 21 Bp aus dem pBR 322 im AnschluB an das Stop-Codon) erhalt man aus dem pUC 9- 

40 Plasmid mit der kompletten Praproaffeninsulin-lnformation durch Verdauung mit Mbo ll/Sma I und Isolierung 
eines DNA-Fragments von etwa 240 Bp Lange. Durch Ligieren der beiden Proinsulin-Fragmente erhalt man 
das korrekte Ligationsprodukt von etwa 320 Bp Lange (inklusive des Adaptors von 18 Bp). Dieses so 
konstruierte Proinsulin-DNA-Fragment kann nun mit einer Regulationsregion iiber die Eco Rl-negative 
Schnittstelle zusammenligiert werden. 

45 Die gesamte Reaktionsfolge zeigt die Fig. 2, in der A, B und C die DNA fur die Jeweiligen Peptidketten 
des Proinsulinmolekuls, Ad den (dephosphorylierten) Adaptor (a oder b) und Prae die DNA fur die 
Praesequenz des Affenpraeproinsulins bedeuten. 

Eine chemisch-synthetische Regulationsregion bestehend aus einer Erkennungssequenz filr Bam HI, 
dem lac-Operator (O), einem bakteriellen Promotor (P) und einer ribosomalen Bindungsstelle (RB) mit 

so einem ATG-Start-Codon, 6 bis 14 Nucleotide von der RB entfernt, und einer anschlieflenden Erkennungsse- 
quenz fur Eco RI (Figur 3) wird uber die gemeinsame Eco Rl-Uberlappungsregion mit dem nach dem 
vorstehenden Beispiel erhaltenen Proinsulingen-Fragment ligiert. Vorteilhaft wahlt man die folgende synthe- 
tische Regulationsregion (DNA-Sequenz Ha aus der Tabelle 2, entsprechend der deutschen Patentanmel- 
dung P 34 30 683.8): 
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5' GATCCTAAATAAATTCTTGACATTTTTTAAA 3' 
3' GATTTATTTAAGAACTGTAAAAAATTT 5' 

(Bam HI) p 

5' TAATTTGGTATAATGTGTGGAATTGTGAGCG 3* 
3* ATTAAACCATATTACACACCTTAACACTCGC 5' 

0 

5' GAATAACAATTTCACAGAGGATCTAG 3' 
3' CTTATTGTTAAAGTGTCTCCTAGATCTTAA 5' 

RB (Eco RI) 

Ebenso konnen die anderen in der Tabelle 2 genannten synthetischen Regulationsregionen eingesetzt 
werden. Es ist aber auch moglich, eine literaturbekannte naturliche Oder abgeleitete (Perlman et al„ a.a.O.) 
Signalsequenz zu wahlen. 
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dem Bal 31-verkiirzten Proinsulingen getestet. Zum Nachweis der korrekten Verkurzung des Proinsulingens 
durch Bal 31 (Figur 2) wurden die Plasmide mit dem integrierten Proinsulingenfragment von der Eco Rl- 
Schnittstelle aus sequenziert. Von 60 sequenzierten Klonen hatten drei die gewUnschte VerkOrzung von 
zwei Nucleotiden (Figur 4). 
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1 ug des Plasmides pWI 6 wird mit dem Restriktionsenzym Eco Rl geschnitten und anschlieBend in 
Gegenwart von 30 ng DNA-Sequenz I bei 1 6 " C in 6 Stunden zusammenligiert. Nach Transformation in E. 
coli HB 101 werden aus individuellen Klonen Plasmide isoliert und mit Hilfe einer Restriktionsenzymanalyse 
auf die Integration der DNA-Sequenz I getestet. 7 % aller Klone enthielten das Plasmid pWI 6 mit der DNA- 
5 Sequenz I integriert. 

Die Richtung dieser Integrationsreaktion laSt sich mit Standardmethoden der Restriktionsenzymanalyse 
uber eine Doppelverdauung mit Hind lll/Pvu I eindeutig ermitteln. Das Plasmid pWI 6 mit einer DNA- 
Sequenz I in korrekter Leserichtung zum Proinsulingen integriert ist als pWIP 1 in Figur 5 dargestellt. 

Dieses Plasmid kann anschlieBend in verschiedene E. coli-Stamme hineintransformiert werden, urn die 

io SynthesekapazitSt der einzelnen Stamme auszutesten. 

Die Expression der Praesequenz-Proinsulingen-Fusion in E. coli wird folgendermaBen bestimmt: 
1 ml einer mit IPTG (Isopropyl-jS-D-thiogalactopyranosid) induzierten Bakterienkultur bei einer optischen 
Dichte ODeoo von 1,0 und einer Induktionsdauer von 1 Stunde werden mit PMSF 
(Phenylmethylsulfonylfluorid) in einer Endkonzentration von 5x10 _, M gestoppt, in Eis gekUhlt und abzentri- 

is fugiert. Der Zellniederschlag wird anschliessend in 1 ml Puffer (10 mM Tris-HCI, pH 7,6; 40 mM NaCI) 
gewaschen, abzentrifugiert und in 200 ul Puffer (20 % Saccharose; 20 mM Tris-HCI, pH 8,0; 2 mM EDTA) 
resuspendiert, 10 Minuten bei Zimmertemperatur inkubiert, abzentrifugiert und sofort in 500 ul H 2 0 bidest. 
resuspendiert. Nach 10 Minuten Inkubationszeit in Eis werden die "Schock-lysierten" Bakterien abzentrifu- 
giert und der Uberstand eingefroren. Dieser Uberstand wird in einem Standard-lnsulin-RIA (Amersham) auf 

20 Proinsulingehalt getestet. 

Der Bakterienniederschlag wird noch einmal in 200 ul Lysozympuffer (20 % Saccharose; 2 mg/ml 
Lysozym; 20 mM Tris-HCI, pH 8,0; 2 mM EDTA) resuspendiert, 30 Minuten in Eis inkubiert, 3 mal 10 
Sekunden mit Ultraschall behandelt und anschlieBend abzentrifugiert. Der so resultierende Uberstand wird 
als Plasmafraktion auf Gehalt an Proinsulin in einem Radioimmunoassay getestet. 

25 Individuelle Bakterienklone, welche das Plasmid pWIP 1 enthalten, wurden auf ihre SynthesekapazitSt 
und ihre Transportfahigkeit des Proinsulin-Praesequenz-Produktes untersucht. Es konnte gezeigt werden, 
daB sMmtliche Bakterienklone in erwarteter Weise das produzierte Proinsulin zu ungefShr 90 % in den 
periplasmatischen Raum transportierten. Ungefahr 10 % der Proinsulin-RIA-Aktivitat waren noch in der 
Plasmafraktion zu finden. 

30 
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DNA-Sequenz I 

Trlplett Nr. 12 3 

Amlnosaure Nr. Met Lys Qln 
Nucleotid Nr. 5 10 

Codierender Strang 5' AA TTC ATG AAA CAA 

nichtcod. Strang 3' q tac ^ GTT 



5 6 
Thr He 



7 
Ala 



15 20 25 

AGC ACG ATC GCA 
TCG TGC TAG CGT 



CTG 
GAC 



9 

Ala 



Leu 



30 35 
GCA CTC 
CGT GAG 



TTA 
A AT 



12 13 

Pro Leu 

40 

CCG TTA 

GGC AAT 



14 15 16 17 18 19 20 21 22 23 

Leu Phe Thr Pro Val Thr Lys Ala Arg Thr 

**5 50 55 60 65 70 

CTG TTT ACC CCG GTG ACA AAA GCT CGG ACC 

GAC AAA TGG GGC CAC TGT TTT CGA GCC TOG 



2k 25 26 
Pro Glu Met 

75 80 81 
CCA GAA ATG G 3' 
GGT CTT TAC CTT AA 5' 



10 
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DNA-Sequenz II: 



ATG 
TAC 



AAA 

TTT 



CAA 
GTf 



AGC 

TCG 



acg 

TGC 
- Ib 



ATC 
TAQ 



GCA 
CGT 



CTG 
3AC 



TTA 
AAT 



CCG 
GGC 



TTA 
AAT 



CTG 
GAC 



TTT ACC 
AAA TGG 



CCG 
GGC 



GCT 
CGA 



CGG 

GCC 



ACC 
TGG 



CCA 
GOT 



GAA 
CTT 



ATG G 

TAC CTT AA 



Patentansprtiche 

PatentansprUche fUr folgende Vertragsstaaten : 



E, CH, DE, FR, GB, IT, LI, LU, NL, SE 



Synthetische DNA zum Transport von Proteinen in Expressionssystemen, dadurch gekennzeichnet. daB 
die DNA fur eine naturliche Signalsequenz codiert, aber eine oder mehrere Schnittstellen fur Endonu- 
cleasen aufweist, die in der natQrlichen DNA nicht enthalten sind, und daB diese DNA am 3'-Ende 
mindestens 5 bis zu etwa 40 der aminoterminalen codierenden Codons desjenigen Strukturgens 
enthalt, das natUrlicherweise auf die Signalsequenz folgt, woran sich die Aminosaurefolge des ge- 
wunschten Proteins anschlieBt 

DNA nach Anspruch 1, dadurch gekennzeichnet, daB sie interne Schnittstellen vor und/oder nach der 
hydrophoben Region enthalt. 



DNA nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB s 
Signalsequenz der Alkalischen Phosphatase von E. coli codiert. 



i wesentlichen fur die naturliche 



EP 0 177 827 B1 



DNA-Sequenz I 

Triplett Nr. 12 3 

Amlnosaure Nr. Met Lys Gin 

Nucleotld Mr. 5-10 

Codierertder Strang 5' AA TTC ATG AAA CAA 

nichtcod. Strang '3' G TAC TTT GTT 



5 6 
Thr lie 



9 

Ala 



10 
Leu 



12 13 
Pro Leu 



15 20 25 
AGC ACG ATC GCA 
TCG TGC TAG CGT 



CTG 
GAC 



GCA CTC 
CGT GAG 



TTA 
AAT 



CCG TTA 
GGC AAT 



14 15 16 17 18 19 20 21 22 23 
Leu Phe Thr Pro Val Thr Lys Ala Arg Thr 

45 50 55 60 65 70 

CTG TTT ACC CCG GTG ACA AAA GCT CGG ACC 
GAC AAA TGG GGC CAC TGT TTT CGA GCC TGG 



24 25 26 
Pro Glu Met 

75 80 . 84 

CCA G AA ATG G 3' 
GGT CTT TAC CTT AA 5" 



5. Verfahren zur Transportexpression von eukaryotischen, prokaryotischen Oder viralen Proteinen in 
prokaryotischen Zellen, dadurch gekennzeichnet, daB an das Gen fur das zu transportierende Proteine 

50 an eine DNA-Sequenz nach Anspruch 1 bis 4 koppelt, dieses Fusionsgen in einen Vektor einbaut und 
damit eine Wirtszelle transformiert, die das exprimierte Protein aus dem Cytoplasma transportiert. 

6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dafl die synthetische DNA-Sequenz ein wirtseige- 
nes Signalprotein codiert. 

7. Hybridvektor, gekennzeichnet durch eine DNA-Sequenz nach Anspruch 1 bis 4. 
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8. Hybridplasmid, das in einer Eco Rl-Schnittstelle die DNA-Sequenz I gemaS Anspruch 4 inseriert 
enthalt. 

9. Wirtsorganismus, enthaltend einen Vektor nach Anspruch 7 oder 8. 

10. E. coli, enthaltend einen Vektor nach Anspruch 7 oder 8. 
Patentanspriiche ftlr folgenden Vertragsstaat : AT 

10 1. Verfahren zur Herstellung einer synthetischen DNA zum Transport von Proteinen in Expressionssyste- 
men, dadurch gekennzeichnet, daB man eine DNA, die fur eine natQrliche Signalsequenz codiert, aber 
eine oder mehrere Schnittstellen fUr Endonucleasen aufweist, die in der natUrlichen DNA nicht enthalten 
sind, und daB diese DNA am 3"-Ende mindestens 5 bis zu etwa 40 der aminoterminalen Codons 
desjenigen Strukturgens enthalt, das naturlicherweise auf die Signalsequenz folgt, woran sich die 

75 Aminosaurefolge des gewunschten Proteins ausschlieSt. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daB die internen Schnittstellen vor und/oder nach 
der hydrophoben Region eingebaut werden. 

20 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB eine DNA eingesetzt wird, die fUr die 
natUrliche Signalsequenz der Alkalischen Phosphatase von E. coli codiert. 

4. Verfahren zur Transportexpression von eukaryotischen, prokaryotischen oder viralen Proteinen in 
prokaryotischen Zellen, dadurch gekennzeichnet, daB man das Gen fur das zu transportierende Protein 
25 an eine DNA-Sequenz nach Anspruch 1 bis 3 koppelt, dieses Fusionsgen in einen Vektor einbaut und 
damit eine Wirtszelle transformiert, die das exprimierte Protein aus dem Cytoplasma transportiert. 



5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daB die synthetische DNA-Sequenz ein wirtseige- 
nes Signalprotein codiert. 

30 

Claims 

Claims for the following Contracting States : BE, CH, DE, FR, GB, IT, LI, LU, NL, SE 

1. A synthetic DNA for the transport of proteins in expression systems, which DNA codes for a natural 
35 signal sequence but has one or more cleavage sites for endonucleases which the natural DNA does not 
contain, and which DNA contains at the 3' end at least 5 and up to about 40 of the amino-terminal 
coding codons of that structural gene which naturally follows the signal sequence, the amino acid 
sequence of the required protein being connected thereto. 

40 2. A DNA as claimed in claim 1 , which contains internal cleavage sites are incorporated upstream and/or 
downstream of the hydrophobic region. 

3. A DNA as claimed in claim 1 or 2, which essentially codes for the natural signal sequence of the 
alkaline phosphatase of E. coli. 

45 



DNA sequence I 
so Triplet No. 

Amino acid No. 

Nucleotide No. 
gg Coding strand 

Noncoding strand 



5 

5 ' AA TTC 
3' G 



12 3 

Met Lys Gin 
10 

ATG AAA CAA 

TAC TTT GTT 



13 
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4 5 6 7 8 9 10 11 
Ser Thr lie Ala Leu Ala Leu Leu 



12 13 
Pro Leu 



AGC ACG ATC GCA CTG GCA CTC 
TCG TGC TAG CGT GAC CGT GAG 



TTA 
AAT 



40 

CCG TTA 
GGC AAT 



14 15 16 17 18 19 20 21 22 23 

Leu Phe Thr Pro Val Thr Lys Ala Arg Thr 

45 50 55 60 65 70 

CTG TTT ACC CCG GTG ACA AAA GCT CGG ACC 

GAC AAA TGG GGC CAC TGT TTT CGA GCC TGG 

24 25 26 

Pro Glu Met 



CCA GAA ATG G 

GGT CTT TAC CTT AA 



5. A process for the transport expression eukaryotic, prokaryotic or viral proteins in prokaryotic cells, 
which comprises coupling the gene for the protein which is to be transported onto a DNA sequence as 
claimed in claim 1 to 4, incorporating this fusion gene into a vector, and transforming therewith a host 
cell which transports the expressed protein out of the cytoplasm. 

6. The process as claimed in claim 5, wherein the synthetic DNA sequence codes a signal protein 
intrinsic to the host. 

7. A hybrid vector comprising a DNA sequence as claimed in claim 1 to 4. 

8. A hybrid plasmid containing the DNA sequence I as claimed in claim 4 inserted in an Eco Rl cleavage 
site. 

9. A host organism containing a vector as claimed in claim 7 or 8. 

10. E. coli containing a vector as claimed in claim 7 or 8. 
Claims for the following Contracting State : AT 

1. A process for the preparation of a synthetic DNA for the transport of proteins in expression systems, 
which comprises a DNA which codes for a natural signal sequence but has one or more cleavage sites 
for endonucleases which the natural DNA does not contain, and which DNA contains at the 3' end at 
least 5 and up to about 40 of the amino-terminal coding codons of that structural gene which naturally 
follows the signal sequence, the amino acid sequence of the required protein being connected thereto. 



14 
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2. The process as claimed in claim 1, wherein the internal cleavage sites are incorporated upstream 
and/or downstream of the hydrophobic region. 

3. The process as claimed in claim 1 or 2, wherein a DNA which codes for the natural signal sequence of 
5 the alkaline phosphatase of E. coli is used. 

4. A process for the transport expression of eukaryotic, prokaryotic or viral proteins in prokaryotic cells, 
which comprises coupling the gene for the protein which is to be transported onto a DNA sequence as 
claimed in claim 1 to 3, incorporating this fusion gene into a vector, and transforming therewith a host 

70 cell which transports the expressed protein out of the cytoplasm. 

5. The process as claimed in claim 4, wherein the synthetic DNA sequence codes a signal protein 
intrinsic to the host. 

75 Revendications 

Revendicatlons pour les Etats contractants sulvants : BE, CH, DE, FR, GB, IT, LI, LU, NL, SE 

1. ADN synthetique pour le transport de proteines dans des systemes d'expression, caracterise" en ce que 
I'ADN est codant pour une sequence signal naturelle, mais pr^sente un ou plusieurs sites de clivage 
20 pour des endonucldases, qui ne sont pas presents dans I'ADN naturel, et que cet ADN renferme, a 
I'extr^mite' terminale 3', au moins 5 et jusqu'a environ 40 des codons codants amino-terminaux du 
gene structural, qui suit naturellement la sequence signal, a laquelle est rattachee la sequence des 
acides amines de la proteine souhaitie. 

25 2. ADN selon la revendication 1 , caractirise' en ce qu'il contient des sites de clivage internes avant et/ou 
apres la region hydrophobe. 

3. ADN selon la revendication 1 ou 2, caracterise en ce qu'il est surtout condant pour la sequence signal 
naturelle de la phosphatase alcaline d'E. coli. 

30 
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Sequence I d'ADN 
Triplet N° 
Acide amine N' 
Nucleotide N° 
Br in codant 
Br in non codant 



1 2 3 

Met Lys Gin 
5 • 10 

AA TTC ATO AAA CAA 

0 TAC TTT OTT 



Ser 



5 6 
Thr lie 



7 
Ala 



8 
Leu 



9 
Ala 



10 
Leu 



11 
Leu 



12 13 
Pro Leu 



15 20 
AGC ACG 
TC3 TGC 



ATC 
TAG 



25 

GCA 

CGT 



CTG 
GAC 



GCA CTC 
CGT GAG 



TTA 
AAT 



40 

CCG TTA 
OGC AAT 



14 
Leu 



15 16 17 18 19 20 21 22 23 
Phe Thr Pro Val Thr Lys Ala Arg Thr 



*5 50 55 60 65 70 

CTG TTT ACC CCG GTG ACA AAA GCT CGG ACC 
GAC AAA TOG GOC CAC TGT TTT CGA OCC TGG 



24 25 26 
Pro Qlu Met 

75 80 84 

CCA GAA ATG G 3' 
GGT CTT TAC CTT AA 5' 



5. Precede d'expression par transport de proteines eucaryotes, procaryotes ou virales dans des cellules 
so procaryotes, caracterise en ce qu'on couple le gene pour la proteine a transporter a une sequence 
d'ADN selon I'une quelconque des revendications 1 a 4, et qu'on incorpore ce gene de fusion a un 
vecteur, avec lequel on transforme une cellule hote, qui transporte hors du cytoplasme la proteine 
exprimee. 

55 6. Procede selon la revendication 5, caracterise en ce que la sequence d'ADN synthetique est codante 
pour une proteine signal specifique a I'hote. 

7. Vecteur hydride, caracterise par une sequence d'ADN selon I'une quelconque des revendications 1 a 4. 
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8. Plasmide hydride, qui contient, dans un site de clivage Eco Rl, la sequence I d'ADN inse76e selon la 
revendication 4. 

9. Organisms note, contenant un vecteur selon la revendication 7 ou 8. 

10. E. coli, contenant un vecteur selon la revendication 7 ou 8. 
Revendications pour I'Etat contractant sulvant : AT 

1. Proc6d6 de fabrication d'un ADN syntftetique pour le transport de prolines dans des systemes 
d'expression, caracterise en ce que I'ADN est codant pour une sequence signal naturelie, mais 
presente un ou plusieurs sites de clivage pour des endonucleases, qui ne sont pas presents dans 
I'ADN naturel, et que cet ADN renferme, a I'extremite terminale 3', au moins 5 et jusqu'a environ 40 
des codons codants amino-terminaux du gene structural, qui suit naturellement la sequence signal, a 
laquelle est rattach^e la sequence des acides amines de la proline souhaitie. 

2. Precede selon la revendication 1 , caracterise' en ce que les sites de clivage internes sont inseres avant 
et/ou apres la region hydrophobe. 

3. Proc6d6 selon la revendication 1 ou 2, caractiris6 en ce qu'on utilise un ADN qui est codant pour la 
sequence signal naturelie de la phosphatase alcaline d'E. coli. 

4. Procede^ d'expression par transport de proteines eucaryotes, procaryotes ou virales dans des cellules 
procaryotes, caracteVise" en ce qu'on couple le gene pour la proline a transporter a une sequence 
d'ADN selon I'une quelconque des revendications 1 a 3, et qu'on incorpore ce gene de fusion a un 
vecteur, avec lequel on transforme une cellule hote, qui transporte hors du cytoplasae la protelne 
exprimee. 

5. ProcSde' selon la revendication 4, caracterise^ en ce que la sequence d'ADN synth^tique est codante 
pour une proteine signal sp^cifique a I'hote. 
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